[Alteryx Designer:ツールのご紹介]データ入力ツールについて
Alteryx絶賛勉強中のshoです。
はじめに
先日無事、初心者向け認定試験Alteryx Designer Coreに合格しました。
Alteryxの認定試験の詳細については、こちらにて紹介しています。
Alteryx Designer Coreを受験するにあたっては、各種ツールの理解を深めておく必要があります。
前回に引き続き、今回は“データ入力”ツールについて学んで行きたいと思います。
- Inputting Data into Your Workflow
- Connecting to Multiple Sheets at Once
- The Ultimate Input Data Flowchart
- データ入力ツール
今回は、上記ページにて、Alteryx Designerのツールの中で入出力カテゴリにある“データ入力”ツールについて、勉強してみました。
データ入力ツール(Input Data Tool)
データ入力ツールは、データを読み込む際に使用するツールです。
ファイルやデータベースからデータを読み込むことが可能です。詳しくは、データ入力ツールの“ファイルタイプ”と“データベース”をご確認ください。データ入力ツールの特徴として、出力アンカーのみで入力アンカーがないことが挙げられます。
今回は、よく使う以下のファイルに関してみていきたいと思います。
- CSVファイル
- Excelファイル
- Alteryxデータベースファイル
CSVファイル
以下のいずれかの方法で読み込むファイルを指定することが可能です。
- データ入力ツールを選択し、キャンバスにドラッグし、“ファイルまたはデータベースを接続”から対象のファイルを指定
- エクスプローラー上で対象のファイルを選択し、キャンバスにドラッグする
データ入力ツールは、CSVファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- レコード制限:
抽出対象のデータを何行目まで読み込むかを指定(数値を入力)します。
デフォルトでは、指定がないため、すべてのデータを読み込みます。 - サブディレクトリを検索:
指定したディレクトリの直下のファイルだけではなく、指定したディレクトリに保存されているフォルダにあるファイルも読み込み対象することが可能です。
有効化する場合にはチェックを入れます。 - ファイル名をフィールドとして出力する:
読み込み対象のファイル情報をデータ内に含めることが可能です。
以下のいずれかを設定します。 - いいえ(デフォルト)
- ファイル名のみ
- フルパス
- 区切り記号:
データの区切り文字を設定します。 - 先頭行にフィールド名を含める:
先頭行にフィールド名が入力されている場合には、チェックを入れます。
デフォルトでは、有効化されていますのでフィールド名がない場合には無効化してください。 - フィールド長:
フィールドの文字数(最大文字数)を設定します。
デフォルトは254と設定されています。 - データインポートを開始する行:
データの読み込みを開始する行を指定します。
デフォルトは1と指定されています。 - 以下の区切り文字を無視する:
指定した区切り文字が引用の中に使用されている場合に、その文字を区切り文字として読み込まないことが可能です。以下のいずれかを設定します。
以下のいずれかを設定します。 - 引用符(")
- 一重引用符(')(デフォルト)
- 自動
- なし
- 読み込みエラーを警告として扱う:
不正なデータが含まれていた場合に、通常エラーとして認識されるものを警告として扱うことが可能です。
この機能を有効化した場合、不正なデータが含まれている場合でも、そのまま読み込みを続行することが可能です。
デフォルトでは、無効化されているためそのままデータの読み込みを続行したい場合は、チェックを入れてください。 - コードページ:
読み込み対象のデータの文字コードを指定します。
設定した文字コードと実際にファイルに使用されている文字コードが異なる場合、文字化けが発生します。 - 共有書き込みアクセスを許可する:
処理中のファイルを読み取る場合に設定します。 Webログを読み取るためのオプション機能となります
デフォルトでは、無効化されているためそのようなデータを扱う場合は、チェックを入れてください。
Excelファイル
以下のいずれかの方法で読み込むファイルを指定することが可能です。
- データ入力ツールを選択し、キャンバスにドラッグし、“ファイルまたはデータベースを接続”から対象のファイルを指定
- エクスプローラー上で対象のファイルを選択し、キャンバスにドラッグする
データ入力ツールは、Excelファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- レコード制限:
抽出対象のデータを何行目まで読み込むかを指定(数値を入力)します。
デフォルトでは、指定がないため、すべてのデータを読み込みます。 - サブディレクトリを検索:
指定したディレクトリの直下のファイルだけではなく、指定したディレクトリに保存されているフォルダにあるファイルも読み込み対象することが可能です。
有効化する場合にはチェックを入れます。 - ファイル名をフィールドとして出力する:
読み込み対象のファイル情報をデータ内に含めることが可能です。
以下のいずれかを設定します。 - いいえ(デフォルト)
- ファイル名のみ
- フルパス
- 先頭行にデータを含める:
先頭行にヘッダーがない場合には、チェックを入れます。
デフォルトでは、無効化されていますのでヘッダーがない場合には有効化してください。 - データインポートを開始する行:
データの読み込みを開始する行を指定します。
デフォルトは1と指定されています。
Alteryxデータベースファイル
以下のいずれかの方法で読み込むファイルを指定することが可能です。
- データ入力ツールを選択し、キャンバスにドラッグし、“ファイルまたはデータベースを接続”から対象のファイルを指定
- エクスプローラー上で対象のファイルを選択し、キャンバスにドラッグする
データ入力ツールは、Alteryxデータベースファイルを読み込み対象として指定した後、以下の内容について指定が可能です。
- レコード制限:
抽出対象のデータを何行目まで読み込むかを指定(数値を入力)します。
デフォルトでは、指定がないため、すべてのデータを読み込みます。 - サブディレクトリを検索:
指定したディレクトリの直下のファイルだけではなく、指定したディレクトリに保存されているフォルダにあるファイルも読み込み対象することが可能です。
有効化する場合にはチェックを入れます。 - ファイル名をフィールドとして出力する:
読み込み対象のファイル情報をデータ内に含めることが可能です。
以下のいずれかを設定します。 - いいえ(デフォルト)
- ファイル名のみ
- フルパス
データ入力(Input Data)ツールを使う上でのコツ
複数のファイルからデータを読み込みたい場合やファイル名に命名規則がある場合、都度ファイル名を変更せずにワイルドカードをファイルURLに使用することでデータを読み込むことが可能です。
- sourceフォルダに保存されているすべてのCSVファイルが読み込み対象とする場合
C:\Users\[ユーザー名]\Desktop\Alteryx\source\*.csv
C:\Users\[ユーザー名]\Desktop\Alteryx\source\sales_20$$.csv
そのため、sales_2020.csvは読み込み対象となりますが、sales_20200301.csvは、“sales_20”以降が2文字以上となるため、読み込み対象外となります。
C:\Users\[ユーザー名]\Desktop\Alteryx\source\sales_20*.csv
このようにワイルドカードを使用することで、複数のファイルをファイルURLを変更することなく読み込み対象とすることが可能です。
詳細につきましては、こちらをご確認ください。
データの形式(項目数や項目順)がすべてのファイルにて一致していることが前提条件となりますがぜひ活用してみてください。
最後に
Alteryx Designerのデータ入力ツールについて、まとめてみました。
データ入力ツールは様々なデータを取り込み、Alteryxにて分析・レポート作成をする場合に最初に使用することが多いツールとなります。
ぜひこのツールを使用して様々な分析にお役立てください。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。